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Genes at least partially composed of stochastic synthetic polynucleotides are simultaneously produced wihtin the 
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ing said genes are simultaneously grown, so as to clone the stochastic genes and to promote the production of the proteins 
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(57)Abrege 

On produit simultanement, au sein d'un meme milieu, des genes au moins partieilement composes de polynucl6- 
otides synth6tiques stochastiques; on introduit les genes ainsi obtenus dans des celiules-hotes; on cultive simultanfcment les 
souches independantes de cellules-hdtes modifiees renfermant ces genes, de maniere k doner les genes stochastiques et 4 
proyoquer la production des proteines exprimees par chacun de ces genes stochastiques; on effectue le criblage et/ou la s6- 
lection des souches de cellules-hdtes modifiees de fa9on £ identifier les souches produisant des peptides on polypeptides 
ayant au moins une propriete donnee, on isole les souches ainsi identifiees et on les cultive de fa$on h produire au moins 
un peptide ou polypeptide ayant cette propriete. De facon similaire, on peut produire des sequences stochastiques d'ADN 
ou d'ARN presentant au moins une propriete desiree en effectuant ie criblage ou la s61ection des souches de cellules-hdtes 
modifiees de maniere a identifier les souches renfermant de telles sequences d'ADN ou d'ARN dans leur g6nome. 
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PROCEDE D ' OBTENTION D'ADN, ARN. PEPTIDES, 
POLYPEPTIDES 00 PROTBINES . PAR UNE TECHNIQUE 
DE RECOMBINAISON D'ADN 

La prfisente invention a pour objet un procgde" d'obtention 
d'ADN, ARN, peptides, polypeptides ou prolines, au moyen 
de cellules-hates modifiers contenant des gSnes capables 
d'exprimer ces ARN, peptides, polypeptides ou prolines, 
c'est-a-dire en utilisant une technique de recombinaison 
d'ADN. 

L • invention vise notamment a produire des gSnes ou frag- 
ments de genes stochastiques, de facon a permettre l'obten- 
tion simultanee, apres transcription et traduction de ces 
genes, d'un tres grand noinbre (de l'ordre de dix mille au 
tnoins) de prolines completement nouvelles ou hybrides de 
protSines connues, en presence de cellules-hfites (souches 
bacteriennes ou eucaryotes) contenant les gSnes respective- 
ment capables d'exprimer ces prolines et d'effectuer 
ensuite une selection ou criblage parmi lesdites souches, 
en vue de determiner celles qui produisent des protSines 
prSsentant des propriStSs dSsirees, par exemple des pro- 
prifitSs structurelles enzymatiques , catalytiques , antigeni- 
ques, pharmacologiques, ou des proprifitSs de ligand, et 
plus generalement, des propriStfis chimiques, biochimiques, 
biologiques, etc. 

L' invention a Sgalement pour but de permettre l'obtention 
de sequences d'ADN ou d'ARN pr6sentant des proprifites 
utilisables, notamment des propri€tes chimiques, biochimi- 
ques ou biologiques. 

On comprend done que 1' invention est susceptible de rece- 
voir de tres nombreuses applications, dans des domaines 
tres varies de la science, de 1' Industrie et de la m6de- 
cine . 
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Le proc§d§ de production de peptides ou polypeptides selon 
1' invention est caracterisS en ce que l'on produit simulta- 
nement, au sein d'un meme milieu, des genes au moins 
partiellement composes de polynucleotides synthgtiques 
stochastiques, que l'on introduit les genes ainsi obtenus 
dans des cellules-notes, que l'on cultive simultanement les 
souches independantes de cellules-hdtes modifiers renfer- 
nant ces genes, de manifire a doner les genes stochastiques 
et a provoquer la production des protSines exprimees par 
chacun de ces genes stochastiques, que l'on effectue le 
criblage et/ou la selection des souches de cellules-hdtes 
modifiers de fagon a identifier les souches produisant des 
peptides 6u polypeptides ayant au moins une propriety 
donnee, que l'on isole les souches ainsi identifiers et 
qu'on les cultive de fagon a produire au moins un peptide 
ou polypeptide ayant ladite propriety. 

Conformement a un premier mode de mise en oeuvre de ce 
proc£d€, on produit les genes par copolymer! sation stochas- 
tique des quatre sortes de deoxyphosphonucleotides A, C, G 
et T a partir des deux extremitfis d'un vecteur d' expression 
prealablement linearise, puis formation d'extr§mit§s 
cohSsives de fagon a former un premier brin d'ADN stochas- 
tique, constitue" d'une molecule du vecteur d' expression 
possSdant deux sequences stochastiques dont les extremitSs 
3' sont complementaires, suivie de la synth&se du second 
brin de cet ADN stochastique . 

Selon un deuxieme mode de mise en oeuvre, on produit les 
gSnes par copolymerisation stochastique d ' oligonucleotides 
sans extremitSs cohSsives, de fagon a former des fragments 
d'ADN stochastiques, suivie de la ligation de ces fragments 
a un vecteur d' expression prealablement linearise. 

Le vecteur d' expression peut Stre un plasmide, notamment un 
plasmide bactfirien. D'excellents r€sultats ont ete obtenus 
en utilisant, corame vecteur d' expression, le plasmide pUC8. 
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Le vecteur d 1 expression peut figalement §tre un ADN viral ou 
un hybride de plasmide et d'ADN viral. 

Les cellules-hdtes peuvent 6tre des cellules procaryotes 
telles que les cellules HB 101 et C 600, ou des cellules 
eucaryotes . 

Lorsque I 1 on procSde conform€znent au deuxi&me mode de mise 
en oeuvre susmentionng , on peut utiliser des oligonucleo- 
tides formant un groupe d'octam&res palindromiques . 

Des rSsultats particuliSreroent bons sont obtenus en utili- 
sant le groupe d* octamSres palindromiques suivant : 

5' GGAATTCC 3 1 
5' GGTCGACC 3 1 
5* CAAGCTTG 3' 
5' CCATATGG 3' 
5' CATCGATG 3\ 

On peut figalement utiliser des oligonucleotides formant un 
groupe d'heptaroSres palindromiques. 

De trSs bons rSsultats sont obtenus en utilisant le groupe 
d'heptamSres palindromiques suivant : 

5' XTCGCGA 3' 
5' XCTGCAG 3' 
5' RGGTACC 3' 

oil X ■ A, G f C ou T et R * A ou T. 

ConformSment & un mode de mise en oeuvre particuliSrement 
avantageux, I'on isole et purifie ^ADN transformant des 
plasmides provenant d'une culture de souches indSpendantes 
de cellules-hates modififies obtenues en proc€dant de la 
maniSre spScififie ci-dessus, puis l'on provoque la coupure 
de l 1 ADN purififi au moyen d'au moins un enzyme de 
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restriction correspondant k un site spgcifique de coupure 
enzymatique present dans ces octamSres ou heptamSres 
palindromiques mais absent du vecteur d 1 expression utilisS, 
cette coupure €tant suivie de 1 9 inactivation de l v enzyme de 
restriction, et I'on traite ensuite simultan€ment 1' ensem- 
ble des fragments d'ADN stochastiques lin€aris§s, ainsi 
obtenus, par la T4 DNA ligase, de fagon k cr€er un nouvel 
ensemble d 1 ADN contenant des sequences stochastiques 
nouvelles, ce nouvel ensemble pouvant done contenir un 
nombre de gSnes stochastiques sup€rieur au nombre de gSnes 
de 1* ensemble initial, et on utilise ce nouvel ensemble 
d'ADN trans formant pour modifier des cellules-hdtes et 
doner les g&nes, et, finalement, on crible et/ou on 
sSlectionne et on isole les nouvelles souches de cellules- 
hdtes trans formSes et finalement, on les cultive de fagon k 
produire au moins un peptide ou polypeptide, par exemple 
une prot6ine nouvelle. 

La proprifitfi servant de crit&re de selection des souches de 
cellules-h8tes peut §tre 1' aptitude des peptides ou poly- 
peptides, produits par cette souche, k catalyser une 
reaction chimique donnSe. 

Par exemple, pour la production d'une plurality de peptides 
et/ou polypeptides, ladite propriStS peut Stre 1' aptitude k 
catalyser une sequence de rSactions conduisant d f uri groupe 
initial donnS de composes chimiques k au moins un compost 
cible. 

En vue de la production d'un ensemble constitui d'une 
pluralitS de peptides et/ou polypeptides rfif lexivement 
autocatalytiques , ladite proprifitS peut Stre 1" aptitude de 
catalyser la synthase de cet ensemble lui-mSme k partir 
d r acides amines et/ou d' oligopeptides , dans un milieu 
appropr ifi • 

Ladite propri€t€ peut Sgalement £tre l f aptitude & modifier 
sSlectivement les propri€t€s chimiques et/ou biologiques 
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d # un compost donne, par exemple 1' aptitude k modifier 
sSlectivement l'activite catalytique d'un polypeptide. 

Ladi te propriety peut aussi fitre 1 ■ aptitude k simuler , 
inhiber ou modifier au moins une fonction biologique d'au 
moins un compose biologiquement actif, choisi, par exemple, 
parmi les hormones , les neurotransmetteurs , les facteurs 
d' adhfision ou de croissance et les regulateurs specif iques 
de la replication de 1 'ADN et/ou de la transcription et/ou 
de la traduction de l'ARN. 

Ladite propriete peut Stre, egalement, 1' aptitude du 
peptide ou polypeptide & se lier k un ligand donne. 

L 1 invention a egalement pour objet l 1 utilisation du peptide 
ou polypeptide obtenu par le proc6d€ sp6cifie ci-dessus 
pour la detection et/ou la titration d f un ligand. 

Conformement i un mode de mise en oeuvre particuliSrement 
avantageux, le critSre de selection de la souche de eel- 
lules-hOtes modifiee est l f aptitude des peptides ou poly- 
peptides k simuler ou modifier les effets d'une molecule 
biologiquement active , par exemple une proteine, et l'on 
effectue le criblage et/ou la selection de la souche de 
cellules-h8tes modifiee produisant au moins un peptide ou 
polypeptide ayant cette propriete en pr€parant des anti- 
corps contre cette molecule active, et en utilisant ces 
anticorps, aprSs leur purification, pour identifier les 
souches con tenant ce peptide ou polypeptide, puis en 
cultivant les souches ainsi identifiees et en separant et 
en purifiant le peptide ou polypeptide produit par ces 
souches, et, finalement, en soumettant ce peptide ou 
polypeptide & un essai in vitro pour verifier qu'il pr€- 
sente bien 1' aptitude k simuler ou modifier les effets de 
ladite molecule. 

Conformement & un autre mode de mise en oeuvre du procede 
selon 1' invention, la propriete servant de critSre de 
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selection est devoir au moins un Epitope seinblable k l f un 
des Epitopes d'un antigSne donnfi. 

L' invention porte Sgalement sur les polypeptides obtenus 
par le proc6d£ sp€cifi£ ci-dessus, et utilisables comme 
substance active chimioth£rapeutique • 

En particulier, dans le cas oil ledit antigSne est l'EGF, 
1' invention permet I'obtention de polypeptides utilisables 
pour le traitexnent chimiothirapeutique des 6pith61iomes. 

Selon une variante du proc€d£, I'on identifie et isole les 
souches de cellules-hates modifiSes produisant les peptides 
ou polypeptides ayarit la propri€t§ d£sir€e par chromato- 
graphic d' affinity sur anticorps correspondant 4 une 
protSine exprimie par la partie naturelle de I'ADN hybride. 

Par exeraple, dans le cas oil la partie naturelle de l'ADN 
hybride contient un gSne exprimant la {3-galactosidase, I'on 
peut avantageusement identifier et isoler lesdites souches 
de cellules-hdtes modifiSes par chromatographie d 1 affinity 
sur anticorps anti- {3-galactosidase. 

AprSs expression et purification des peptides ou polypepti- 
des hybrides, on peut s£parer et isoler leurs parties 
nouvelles. 

L • invention porte ggalement sur une application du proc6d€ 
sp§cifi§ ci-dessus pour la preparation d'un vaccin, cette 
application 6tant caractSrisfi par le fait que l'on 
isole des anticorps contre un agent pathogSne, par exemple 
des anticorps form§s aprSs injection de cet agent pathog&ne 
dans I'organisme d'un animal capable de former des anti- 
corps contre cet agent, et on utilise ces anticorps pour 
identifier les clones produisant au moins une protSine 
ayant au moins un Spitope semblable k I'un des Epitopes de 
1* agent pathogSne, on cultive les souches de cellules-hfites 
modifies correspondant k ces clones, de facon Si produire 
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cette protfiine, on isole et purifie cette proline k partir 
des cultures de ces s ouches de cellules, et on utilise 
cette protfiine pour la production d'un vaccin contre 
1' agent pathogSne. 

Par exemple, pour la preparation d'un vaccin anti-HVB, l'on 
peut extraire et purifier au moins une protiine de capside 
de virus HVB, injecter cette protiine dans l'organisme d'un 
animal capable de former des anticorps contre cette pro- 
line, recueillir et purifier les anticorps ainsi formSs, 
utiliser ces anticorps pour identifier les clones produi- 
sant au moins une protfiine ayant au moins un epitope 
semblable k 1'un des Epitopes du virus HVB, cultiver les 
souches de cellules-hdtes modifies correspondant k ces 
clones, de fagon h produire cette prot€ine, isoler et 
purifier cette protiine & partir des cultures de ces* 
souches de cellules, et utiliser cette protSine pour la 
production d'un vaccin anti-HVB. 

Avantageusement, conform&nent k un mode de mise en oeuvre 
du proc€d€ selon 1* invention, les cellules-hdtes consistent 
en bactSries du genre Escherichia coli dont le gfinome ne 
contient ni le gSne naturel exprimant la {3-galactosidase, 
ni le gSne EB6, c'est-&-dire des bactSries E. coli (Z~, 
EBG~) , on cultive les cellules-hdtes modif i§es en presence 
du milieu X-gal .et de l'indiicteur IFTG, que l'on d€tecte, 
dans le milieu de culture, les clones positifs pour la 
fonction (3-galactosidase, et, finalement, on transplante 
ensuite cet ADN dans une souche de cellules-hdtes appro- 
pri€e h la culture en grande quantitS en vue de la produc- 
tion industrielle d'au moins un peptide ou polypeptide. 

La proprifitS servant de crit&re de selection des souches de 
cellules-hdtes trans form£es peut Sgalement Stre 1' aptitude, 
des polypeptides ou protSines, produites par culture de ces 
souches, k se lier & un composS donn§. 
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Ce composfi peut fitre, notamment, avantageusement choisi 
parmi les peptides, les polypeptides et les protfiines, 
notaniment les proteines regulatrices de I'activite de 
transcription de 1'ADN. 

D ' autre part, ledit compose peut ggalement §tre choisi 
panni les sequences d'ADN et d'ARN. 

L • invention a ggalement pour objet les proteines obtenues 
dans le cas otl la propri6te servant de critSre de selection 
des souches de cellules-h&te transform§es consiste precise- 
ment dans 1' aptitude de ces proteines h se lier £ des 
proteines regulatrices de 1'activitS de transcription de 
1'ADN, ou encore k des sequences d'ADN ou d'ARN. 

L* invention a, en outre, pour objet 1' utilisation d'une 
protSine, obtenue dans le premier cas particulier qui vient 
d'etre mentionne, comme sequence cis-regulatrice de la 
replication ou la transcription d'une sequence d'ADN 
voisine. 

D 1 autre part, 1' invention a §galement pour objet 1' utilisa- 
tion des proteines obtenues dans le second cas particulier 
susmentionne pour modifier les propriStSs de transcription 
ou de replication d'une sequence d'ADN, dans une cellule 
contenant cette sequence d'ADN, et exprimant cette pro- 
tSine* 

L 1 invention a ggalement pour objet un precede de production 
d'ADN, caractirisg par le fait que l'on produit simultanS- 
ment, au sein d'un mgme milieu, des g&nes au moins partiel- 
lement composes de polynucleotides synthetiques stochasti- 
ques, que l'on introduit les gSnes ainsi obtenus dans des 
cellules-h6tes, de facon k produire un ensemble de eel- 
lules-h6tes modifi6es, que l'on effectue un criblage et/ou 
une selection de cet ensemble, de fagon & identifier les 
cellules hdtes qui renferment dans leur genome des sequen- 
ces stochastiques d'ADN presentant au moins une propriete 
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d£sir€e, et l'on isole finalement l'ADN h partir de cul- 
tures des cellules-hdtes ainsi identifies. 

L v invention a, en outre, pour objet un proc€d€'de produc- 
tion d'ARN, caractfirisfi par le fait que l'on produit 
simultan€ment, au sein d'un m6me milieu, des gSnes au moins 
partiellement composes de polynucleotides synthStiques 
stochastiques , que l'on introduit les gSnes ainsi obtenus 
dans des cellules-hdtes, de facon k produire un ensemble de 
cellules-hdtes modifies, que l'on cultive simultan£ment 
les souches indSpendantes de cellules-hdtes modifies ainsi 
produites, que l'on effectue un criblage et/ou une selec- 
tion de cet ensemble, de facon k identifier les cellules- 
hdtes qui renferment des sequences stochastiques d'ARN 
prfisentant au moins une propri€t£ d£sir€e, et que l'on 
isole l'ARN & partir de cultures de cellules-hdtes ainsi 
identifies . 

Ladite propriStS peut §tre, avantageusement , 1' aptitude k 
se lier k un compose donne, qui peut etre, par exemple, un 
peptide, un polypeptide ou une protfiine, ou bien 1* aptitude 
2i catalyser une reaction chimique donn€e, ou encore la 
propriety d'etre un ARN de transfert. 

On va maintenant decrire, plus en details, le procSd€ selon 
l 1 invention, ainsi que certaines de ses applications, en se 
r6f6r ant k des exemples, non limitatifs, de mise en oeuvre. 

Tout d'abord, on va decrire des modes op€ratoires particu- 
lar ement avantageux pour effectuer la synthase de gSnes 
stochastiques et 1 ' introduction de ces gSnes dans des 
bact€ries, de maniSre k produire des souches de bacteries 
transformees. 

I) Synthase directe sur un vecteur d' expression 



a) Linearisation du vecteur 
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30 jig (c'est-i-dire approximativement 10 molecules) du 
vecteur d* expression pUC8 sont linearises par incubation 
pendant 2 heures k 37° (avec 100 unites de !• enzyme de 
restriction PstI dans une volume de 300 jil du tampon 
standard approprie. Le vecteur linearise est traite au 
phSnol-chloroforme puis pr€cipit§ k methanol, repris dans 
un volume de 30 pi et charge sur un gel d 9 agarose k 0,8 %, 
en milieu standard TEB. AprSs migration dans un champ de 
3V/ cm pendant trois heures, le vecteur line aire est electro- 
eiu6 r precipite k methanol et repris dans 30 ^il d'eau. 

b) Synthase stochastique par 1' enzyme 
Terminal-Trans f erase ( TdT ) 



On fait reagir 30 ^ig du vecteur linearise avec 30 unites de 
TdT dans 300 ;il du tampon approprie, pendant deux heures, k 
37°C, en presence de ImM de dGTP, ImM de dCTP, 0 r 3mM de 
dTTP et ImM de dATP: On choisit une concentration plus 
basse de dTTP, dans le but de diminuer la frequence des 
codons "stop" dans l'ARN messager correspondant. Un resul- 
tat semblable, quoique moins favorable, peut Stre obtenu en 
utilisant une concentration plus basse pour le d 1 ATP que 
pour les autres deoxynucieotides triphosphates,. Le .progrSs 
de la reaction* de polymerisation sur 1 ' extremite 3 1 des 
sites Pst I est suivi par 1' analyse sur gel de parties 
aliquotes pr 6 levees en cours de reaction. 

Lorsque la reaction atteint ou depasse une valeur moyenne 
de 300 nucleotides par extremite 3 1 , elle est interrompue 
et les nucleotides libres sont separ6s du polymSre par 
precipitation differentielle ou par passage sur tamis 
moieculaire du type Biogel P60. AprSs concentration par 
precipitation Si I'ethanol, le polymSre est soumis sequen- 
tiellement & une polymerisation suppiementaire par TdT en 
presence de dATP d'abord, puis de dTTP. Ces deux derniSres 
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reactions sont s6par6es par une filtration sur gel et 
conduites pendant des temps courts (30 secondes k 3 minu- 
tes) , de maniSre k aboutir k V addition s€quentielle de 
10-30A, suivis de 10-30 T & 1 1 extr6mit§ 3' des polymferes. 

c) Synthase du second brin de l'ADN stochastique 



Chague molecule de vecteur possSde, & 1' issue des opera- 
tions pr6c6dentes f deux sequences stochastiques dont les 
ex tr Smiths 3 1 sont complSmentaires . Le melange de polymSres 
est alors incubfi dans des conditions favorisant 1' hybrida- 
tion de ces ex tr Smiths compiementaires (150 mM Naci, 10 mM 
Tris-HCl, pH 7,6, 1 mM EDTA, k 65°C, pendant 10 minutes, 
puis abaissement de la temperature jusqu 1 ^ 22°C, k raison 
de 3 k 4°C/heure) . Les polym&res hybrid^ s sont alors sounds 
k 1' action de 60u du grand fragment de la polymerase I 
(Klenow) en presence des quatre nucleotides triphosphates 
(200mM) & 4°C, pendant deux heures. Cette etape realise la 
synthase du second brin k partir de l'extremite 3' des 
polym&res. hybrides. Les molecules resultant de cette 
synthase directe k partir d f un vecteur linearise sont alors 
utilisSes pour transformer des cellules competentes. 

d) Transformation des souches competentes 



100 St 200 ml de cellules competentes HB101 ou C600, k la 

concentration de 10 10 cellules/ml, sont incubes avec la 

preparation d'ADN stochastique, en presence de 6mM CaClj, 6 

mM Tris-Hcl, pH8, 6 mM MgCl 2 , pendant 30 minutes, & 0°C. Un 

choc thermique de 3 minutes & 37°C est impose au melange, 

suivi par V addition de 400-800 ml de milieu de culture 

NZY, sans antibiotique. La culture transformee est incubee 

& 37 °C pendant 60 minutes, puis diluee k 10 litres par 

addition de milieu NZY contenant 40 pg/ml d f ampicilline. 

AprSs 3 & 5 heures d 1 incubation k 37°C, la culture ampli- 

fiee est soumise & une centrifugation, et le culot des 

cellules transferases est lyophilyse et conserve & -70 °C. 

7 8 

Une telle culture comprend de 3 x 10 k 10 transf ormants 
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indipendants , contenant chacun un gSne stochastique unique 
insSrS dans un vecteur d 1 expression. 

II) Synthase de gdnes stochastioues k partir d' oligo- 
nucleotides sans extr6mit6s cohesives 

Ce mode opSratoire est fondfi sur le fait que la polymerisa- 
tion d • oligonucleotides palindromiques judicieusement 
choisis permet d 1 assembler des g&nes stochastiques ne 
comportant aucun codon "stop" dans chacun des six cadres de 
lecture possibles, tout en assurant une representation 
equilibree de triplets specif iant tous les acides amines* 
Par ailleurs, et pour eviter la repetition de motifs de 
sequences dans la proteine resultante, les oligonucleotides 
penvent comporter un norabre de bases qui n'est pas un 
multiple de trois. L'exemple suivant decrit 1* utilisation 
d'une combinaison possible d 1 oligonucleotides qui remplit 
ces critSres : 

a) Choix d f un groupe d'octamSres 



Le groupe d' oligonucleotides suivant : 

5' GGAATTCC 3 r 
5' GGTCGACC 3 1 
5 1 CAAGCTTG 3' 
5 1 CCATATGG 3 1 " 
5' CATCGATG 3 1 

est compose de 5 palindromes (done autocompiementaires) 
dont il est facile de verifier que leur polymerisation 
stochastique n'engendre pas de codon "stop" et specif ie 
tous les acides amines. 

Bien entendu, on pourrait egalement utiliser d'autres 
groupes d'octam&res palindromiques n'engendrant pas de 
codons "stop" et specif iant tous les acides amin€s des 
polypeptides. On comprendra egalement que l'on pourrait 
utiliser des groupes d'octam£res non palindromiques & 
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condition d" employer aussi leurs complements par la forma 
tion de segments bicatfinaires . 

b) Assemblage d'un g&ne stochastique & partir d'un groupe 



d'octamSres 



On fait rfiagir un melange comportant 5 )xg de chacun_ des 
oligonucleotides indiqufis ci-dessus (prfialablement phospho- 
ryl6s en 5' par un precede connu en soi) dans un volume de 
100 jil contenant 1 mM ATP f 10 % de polyfithylSneglycol et 
100 u de T 4 DNA ligase, dans le tampon appropriS, & 13 °C, 
pendant six heures. Cette etape effectue la polymerisation 
stochastique des oligomSres sous forme bi-catSnaire, sans 
extrSmitSs cohSsives. On isole alors par passe sur tamis 
molficulaire (Biogel P60) les polymSres resultant de 1' as- 
semblage de 20 & 100 oligom&res. AprSs concentration , cette 
fraction est h nouveau soumise k la polymerisation cataly- 
s£e par la T4 DNA ligase dans les conditions d€crites 
ci-dessus. On isole alors, corome d€crit plus haut, les 
polymSres resultant de 1» assemblage d'au moins 100 oligo- 
m§res. 

c) Preparation du plasmide-hfite 



Le vecteur d' expression pUC8 est linearise par l 1 enzyme Sma 
I dans le tampon approprie, comme decrit ci-dessus. Le 
vecteur linearise par l 1 enzyme Sma I ne comporte pas 
d'extremites coh€sives. Le vecteur linearise est alors 
traite par la phosphatase alcaline d'intestin de veau (CIP) 
& raison d'une unite par ^ig de vecteur dans le tampon 
approprie, £ 37 °C, pendant 30 minutes. L 1 enzyme CIP est 
alors inactiv€e par deux extractions successives au phenol- 
chloroforme. Le vecteur linearise et d6phosphoryie est 
precipite & methanol puis repris dans l'eau & 1 mg/ml. 

d) Ligation des gSnes stochastiques au vecteur 
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Des quantitSs Squimolaires de vecteur et de polym&re sont 
mglangSes et incub6es en presence de 1000 u de T4 DNA 
ligase, 1 mM ATP, 10 % de polySthylSne glycol dans le 
tampon appropri§, pendant 12 heures, & 13°C. Cette Stape 
realise la ligation des polymSres dans le vecteur d 1 expres- 
sion et engendre des molecules bicatSnaires, circulaires 
et, par consequent, transf ormantes . 

Transformation des souches compStentes 

On proc&de h la transformation des souches compitentes de 
la maniSre pr€cSdemment dScrite. 

Ill) Assemblage d'un q5ne stochastique k partir d'un groupe 
d ' heptamSres 

Ce mode op€ratoire se distingue de celui qui vient d'Stre 
dScrit par le fait qu'il utilise des heptam&res palindromic 
ques comportant une extr6mit§ cohesive variable, au lieu 
d'octamSres. II pr§sente l'avantage de permettre 1' assem- 
blage de sequences stochastiques comportant une plus faible 
proportion de motifs identiques. 

a) Choix d'un groupe d'heptamSres 

On peut utiliser, par exemple, les 3 heptam&res palindromi- 
ques suivants : 

5' XTCGCGA 3' 
5' XCTGCAG 3' 
5' RGGTACC 3' 

pour lesquels X = A, G r C ou T et R = A ou T et dont la 
polymerisation ne peut engendrer de codons "stop" et 
comporte des triplets spScifiant tous les acides amines. 

Bien entendu, on pourrait ggalement utiliser tout autre 
groupe d'heptamSres remplissant ces m§mes conditions. 
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b) Polymerisation d'un groupe d'heptamSres 

Cette polymerisation s'effectue exactement de la maniSre 
pr€cedemment decrite dans le cas des octaraSres. 

c) Elimination des extr6mit6s cohesives 



Les polymSres ainsi obtenus comportent une base non appa- 
ri§e & leur deux extremites 5'. II est done n€cessaire 
d • additionner la base compl6mentaire aux extremites 3 1 
correspondantes. Ceci s'effectue de la maniSre suivante : 
on fait reagir 10 de polymSres double brin avec 10 u 
d 1 enzymes de Klenow, en presence des guatre d€oxynucl£o- 
tidephosphates (200 mM) dans tin volume de 100 k 4°C, 

pendant 60 minutes* L 1 enzyme est inactiv€e par extraction 
au ph£nol-chloroforme et les polymSres sont d£barrass§s des 
nucleotides libres r6siduels par precipitation differen- 
tielle. Les polymSres sont alors ligas£s au plasmide-hfite 
(prealablement linearise et dephosphoryie) en procedant de 
la maniSre decrite ci-dessus. 

II est h remarquer que les deux derniers modes operatoires 
qui viennent d'etre decrits utilisent des octam&res ou 
heptamSres palindromiques qui constituent des sites speci- 
fiques d 1 enzymes de restriction. Ces sites sont absents 
pour la plupart du vecteur d' expression pUC8. II est done 
possible d'augmenter considerablement la complexite d'une 
preparation initiale de gSnes stochastiques en procedant de 
la maniSre suivante : on prepare I'ADN des plasmides 
provenant d'une culture de 10 transforroants independants 
obtenus par l'un des deux derniers modes operatoires 
decrits ci-dessus* A cet ADN purifie, on fait alors subir 
une digestion partielle par 1* enzyme de restriction Cla I 
(mode operatoire II) ou par 1' enzyme de restriction Fst I 
(mode operatoire III). AprSs inactivation de 1* enzyme, 
I'ADN partiellement digere est traite k la T4 DNA ligase, 
ce qui a pour effet de cr€er un nombre extrSmement grand de 
sequences nouvelles qui conservent les proprietes 



WO 86/05803 



PCT/CH85/00099 



16 

fondamentales des sequences initiales. Ce nouvel ensemble 
de sequences stochastiques est alors utilise pour transfor- 
mer des cellules competentes. 

Par ailleurs, les gSnes stochastiques clones en proc£dant 
conformement aux modes op€ratoires II et III peuvent §tre 
excises intacts du vecteur d' expression pUC8 en utilisant 
les sites de restriction propres au vecteur de clonage et 
non represents dans 1'ADN stochastique. 

La recombinaison au sein des gfenes stochastiques engendr£s 
par les deux derniers modes opSratoires qui viennent d'Stre 
d6crits, recombinaison qui r 6 suite de 1 ' homologie interne 
et des motifs de recurrence, fournit une importante m€thode 
additionnelle de mutagenese in vivo des sequences codantes. 
II en r§ suite une augmentation du nombre des g&nes nouveaux 
qui peuvent Stre examines* 

Finalement, pour tout processus de generation de g&nes 
synthetiques nouveaux, on peut utiliser de norobreuses 
techniques usuelles de modification des gSnes in vivo ou 
in vitro , telles que changement du cadre de lecture , 
inversion des sequences par rapport Si leur promoteur, ou 
utilisation de souches-h6tes exprimant un ou plusieurs tRNA 
suppresseurs. 

En se r€f Srant & la partie de la description qui prSc&de, 
on comprendra qu'il est possible de construire in vitro un 
nombre extrimement grand (par exemple, supSrieur k un 
milliard) de gSnes diffSrents, par polymerisation enzyma- 
tique de nucleotides et d* oligonucleotides. Cette polymeri- 
sation s'effectue selon un processus stochastique determine 
par les concentrations respectives des nucleotides ou 
oligonucleotides presents dans le milieu de reaction * 

Comme indique ci-dessus, deux methodes peuvent §tre utili- 
sees pour doner de tels gSnes (ou sequences codantes) : la 
polymerisation peut s'effectuer directement sur un vecteur 
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de clonage d' expression, prealablement linearise, ou bien 
on peut choisir de procSder sequentiellement a la polymeri- 
sation puis a la ligation des polymSres au vecteur de 
clonage et d' expression. 

Dans les deux cas, on procede ensuite a la transformation 
ou a la transfection de cellules bactiriennes competentes 
(ou de cellules en culture) . Cette etape realise le clonage 
des genes stochastiques dans des cellules vivantes ou ils 
sont indSfiniment propagSs et exprimfis, 

Bien entendu, outre les modes operatoires qui viennent 
d'etre decrits, on pourrait €galement employer toute autre 
methode approprifie pour la synthSse de sequences stochas- 
tiques. En particulier, on pourrait proceder a la polymeri- 
sation, par voie biochimique, d'oligomeres monocatinaires 
d 1 AON ou d'ARN obtenus par synthSse chimique, puis traiter 
ces segments d'ADN ou d'ARN par des proc€dSs connus en soi 
de preparation de .copies d'ADN (c ADN) bicatSnaire en vue 
du clonage des genes. 

Criblage ou selection des souches de cellul es-h6tes 
modif iees 

L' etape ulterieure du procede selon 1' invention consiste a 
examiner les cellules transformees ou transf ect6es , par 
selection ou criblage, en vue d'isoler une ou plusieurs 
cellules dont l'ADN transf ormant ou transf ectant conduise 
la synthSse d'un produit de transcription (ARN) ou de 
traduction (proteine) possedant une propriete souhaitee. 
Ces proprietes peuvent etre, par exemple, enzymatiques , 
fonctionnelles ou structurelles. 

Une des particularites les plus remarquables du procede 
selon 1' invention est de permettre le criblage ou la 
selection simultanee d'un produit exploitable (ARN ou 
proteine) et de son gSne producteur. De surcroit, l'ADN 
synthetise et clone comme decrit peut Stre seiectionne ou 
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criblfi en vue d'isoler des sequences d'ADN constituant un 
produit en soi, dot6 de propri€t6s biochimiques exploita- 
bles. 

On va maintenant dgcrire, h titre d'exemples non limita- 
tifs, des modes op€rato±res pr6f£rentiels pour le crib 1 age 
ou la selection de souches de cellules transforroSes ainsi 
que des protfiines nouvelles present ant un intSrSt en vue 
d 1 applications industrielles ou mfidicales. 

L'un de ces modes opfiratoires r 5 suite de 1'idSe de produire 
une s€rie d 1 anticorps polyclonaux ou monoclonaux, obtenus 
de maniSre connue en soi, dirigSe contre une pro t Sine ou un 
autre type de molScule d'intSr&t biochimigue ou mSdical, 
cette molecule fitant, ou pouvant fetre r endue, immunogfini- 
gue, et d'utiliser ces anticorps comme sonde pour identi- 
fier parmi de trSs nombreux clones transformSs par des 
gSnes stochastigues ceux gui r§agissent avec ces anticorps. 
Cette reaction rfisulte de l'homologie de structure existant 
entre le polypeptide synth€tis€ par le gSne stochastigue et 
la molecule initiale. On peut ainsi isoler de nombreuses 
prolines nouvelles se coroportant comme des Epitopes ou 
determinants antigSnigues de la molecule initiale. De 
telles protSines nouvelles sont susceptibles de simuler, 
stimuler, moduler ou bloguer l f effet de la mol§cule ini- 
tiale. On comprendra gue ce mode de selection' ou de cri- 
blage est, en lui-ra&me, susceptible d' avoir de trSs nom- 
breuses applications pharmacologigues et bio-m€dicales. On 
va maintenant dScrire, h titre d'exemple non limitatif, ce 

premier mode opSratoire en relation avec un cas particulier 

• 
• 

L'EGF (epidermal growth factor) est une petite protSine 
prSsente dans le sang et dont le rfile est de stimuler la 
croissance des cellules §pith€liales. Cet effet est obtenu 
par 1 1 interaction de I'EGF avec un rScepteur spScifigue 
situfi dans la membrane des cellules §pith§liales. 
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On prfipare des anticorps dirigSs contre l'EGF par injection 
chez 1' animal d'EGF couplfi Si KLH (keyhole limpet hemocya- 
nin) pour augmenter 1 1 immunog6nicit§ de l'EGF. Les anti- 
corps anti-EGF des animaux immunises sont purifies, par 
exemple par passage sur une colonne d 1 affinity, dont le 
ligand est l'EGF ou un peptide de synthase correspondant h 
un fragment d'EGF. Les anticorps anti-EGF purifies sont 
utilises comme sonde pour le criblage d'un grand norabre de 
clones bactfiriens lysfis au chloroforme sur support solide. 
Les anticorps anti-EGF se combinent aux peptides ou pro- 
twines stochastiques dont les Epitopes ressemblent & ceux 
de I'antigine initial. Les clones contenant ces peptides ou 
protSines sont mis en Evidence par autoradiographie aprSs 
incubation des supports solides avec de la protSine A 
radioactive ou apr&s incubation avec un anticorps anti- 
anticorps radioactif. 

Ces Stapes identifient les clones contenant chacun une 
protSine (et son gSne) rfiagissant avec 1' anticorps de 
criblage. On peut ainsi faire des criblages panni un trfis 
grand nombre de s ouches cellulaires bactfiriennes ou de 
plagues virales (par exemple de l'ordre de un million) et 
il est possible de dS teeter des quantity s extr&nement 
faibles, par exemple de l'ordre de 1 ng, de protfiine 
produite. On proc&de alors h la culture des clones identi- 
fies puis & la purification des protSines d§tect§es par les 
moyens conventionnels. Les protSines purifiSes sont test6es 
in vitro dans des cultures de cellules Spi the li ales pour 
determiner si elles inhibent, simulent ou mo du lent I'effet 
sur ces cultures de l'EGF. Certaines des protSines obtenues 
par ce moyen sont susceptibles d'etre utilisSes pour le 
traitement chimiothSrapique des SpithSliomes. Les activitSs 
des protSines ainsi obtenues peuvent fitre amSliorSes par 
mutation de I'ADN codant pour les protSines, de manilre 
analogue & celle dScrite ci-dessus. Une variante de ce mode 
opSratoire consiste & purifier des peptides, polypeptides 
ou protSines stochastiques, pouvant Stre utilisSes comme 
vaccins ou plus gSnSralement pouvant Stre utilisSes pour 
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conffirer une immunity contre un agent pathogSne ou pour 
exercer d'autres effets sur le systSme iminunologigue, par 
exemple, crfier une tolSrance ou diminuer 1 1 hypersensibilite 
k 1'figard d'un antigSne donnS, notararaent par suite de la 
coinbinaison de ces peptides , polypeptides ou protfiines avec 
les anticorps dirig€s contre cet antigSne. On comprendra 
que l'on peut utiliser ainsi ces peptides, polypeptides ou 
protSines aussi bien in vitro qu'injrivo. 

Plus prScis&nent, par exemple, dans 1' ensemble des pro- 
lines nouvelles qui rfiagissent avec 1' anticorps contre un 
antigSne donnfi X, chacune a au moins un Epitope en coramun 
avec X f done l 1 ensemble a un ensemble d' Epitopes commun 
avec X. Ceci permet d' utiliser 1' ensemble ou un sous-ensem- 
ble comme vaccin pour confgrer l'immunitS contre X. II est, 
par exemple, aisfi de purifier une ou plusieurs des protSi- 
nes de capside du virus de I'hfipatite B. Ces protfiines sent 
injectfies chez l 1 animal, par exemple le lapin, et on 
recueille les anticorps correspondant 4 1* antigSne de 
dfipart par purification sur colonne d 1 affinity On utilise 
ces anticorps, de la maniSre dficrite ci-dessus, pour 
identifier les clones produisant une prot€ine ayant un 
Spitope semblable h l'un au moins des Epitopes de 1* anti- 
gSne initial. AprSs purification, on utilise ces protSines 
comme antigSne (soit isol€ment, soit en combinaison) dans 
le but de confSrer une protection contre l'hfipatite B. La 
production ultSrieure du vaccin ne n^cessite plus le 
recours & 1' agent pathogSne initial, 

II est h remarquer que, lors de la description des modes 
opSratoires qui pr§cSdent, un certain nombres de maniSres 
de procSder ct la selection et au criblage ont €t€ dScrits. 
Tous ces modes opfiratoires impliquent la purification d'une 
protSine particuliSre & partir d'une souche transformSe. 
Ces purifications de protSines peuvent Stre effectu§es 
conformfiment aux mfithodes usuelles et font appel, en 
particulier, aux techniques de chromatographic sur gel, sur 
gchangeur d'ion, et h la chromatographic d'affinitS. Par 



WO 86/05803 



PCT/CH85/00099 



21 

ailleurs, les proteines issues de gSnes stochastiques 
peuvent avoir 6te donees sous forme de prolines hybrides, 
comportant, par exemple, une sequence de 1* enzyme 
{i-galactosidase permettant la chromatographic d'affinitfis 
sur anticorps anti-/2-galactosidase et permettant le clivage 
subsequent de la partie hybride (c'est-a-dire permettant de 
sSparer la partie nouvelle de la partie bactSrienne) .On va 
maintenant dScrire le principe et la mise en oeuvre de la 
selection des peptides ou polypeptides et des gdnes corres- 
pondants, exprimant ces peptides ou polypeptides, conforms- 
ment k une deuxiSme mSthode de criblage ou selection fondSe 
sur la detection de 1* aptitude de ces peptides ou polypep- 
tides k catalyser une reaction spScifique. 

A titre d' exemple concret non limitatif, on va dScrire 
la mise en oeuvre du criblage ou de la selection dans le 
cas particulier de proteines capables de catalyser le 
clivage du lactose, ce qui est normalement une fonction 
remplie par l 1 enzyme (3-galactosidase ((3-gal) . 

Comme decrit ci-dessus, la premiSre etape du procede 
consiste k engendrer un trSs grand ensemble de vecteurs 
d' expression exprimant chacun une prot€ine nouvelle dis- 
tincte. De maniSre concrete, on peut, par exemple, choisir 
le vecteur d 1 expression pUC8 avec clonage de sequences 
stochastiques d'ADN au site de restriction Pst I. 
Les plasmides ainsi obtenus sont ensuite introduits dans 
une souche de E. coli dans le genome de laquelle on a 
eiimine par les methodes g6netiques conventionnelles le 
gSne naturel pour la (3-galactosidase, Z, et un deuxiSme 
gSne EBG, sans rapport avec le le premier, mais capable de 
muter vers la fonction ^-gal . De telles cellules-hfites (Z~, 
EBG") ne sont pas capables par elles-mSmes de catalyser 
l'hydrolyse du lactose et, par consequent, d'utiliser le 
lactose comme source de carbone pour la croissance. Ceci 
permet d'utiliser cette souche hote pour le criblage ou la 
selection de la fonction (S-gal. 



WO 86/05803 



PCT/CH85/00099 



22 

Une mSthode d 1 essai biologique qui convient pour 1 1 etude 
des souches transform£es de E. coli pr§ sent ant des g&nes 
nouveaux exprimant la fonction /3 -gal consiste dans la 
culture des bacteries ainsi transfonn£es dans des boites de 
Petri renfermant le milieu X-gal. Dans ce cas, toute 
colonie bacterienne exprimant une fonction $ -gal est 
visualis€e sous forme d'une colonie bleue. En utilisant un 
tel essai biologique, on peut dStecter mfime une activity 
catalytique faible. L'activite specif ique des enzymes les 
plus caract€ristiques s'etablit entre 10 et 10 000 molecu- 
les de produit par seconde. 

En supposant qu'une proteine synthetisee par un g§ne 
stochastique prSsente une activity specif ique faible, de 
l'ordre de une molecule par 100 secondes, il serait tou- 
jour s possible de d§ teeter une telle activity catalytique. 
Dans une boite de Petri renfermant le milieu X-gal, en 
presence de l'inducteur non mStabolisable IPTG (isopropyl- 
-D-thiogalactoside) la visualisation d 1 une region bleue 
requiert le clivage d* environ 10 10 h 10 11 molecules de 

X-gal par millimetre carre. Une colonie bacterienne expri- 

2 

mant un enzyme faible et occupant une super ficie de 1mm 

7 8 

contient environ 10 k 10 cellules. Si chaque cellule 
prSsente une seule copie de 1' enzyme faible, cheque cellule 
doit catalyser entre 10 000 et 100 clivages de X-gal afin 
de pouvoir Stre d£tect€e, ce qui prend environ 2,7 k 2T0 
heures. Etant donne que, dans des conditions sSlectives, on 
peut s'attendre k une amplification du nombre des copies de 
plasmides par cellules, par exemple de 5 & 20 copies par 
cellule et mSme de 100 k 1Q00, et compte tenu du fait que 
jusqu'i 10% des proteines de la cellule peuvent Stre 
sp§cifi€es par le nouveau gSne, la dur€e n£cessaire k la 
detection d'une colonie bleue dans le cas de 100 molecules 
d 1 enzymes de faible activite specif ique par cellule serait 
de l'ordre de 0,27 heure & 2,7 heures. 

Par consequent, le criblage d ! un grand nombre de colonies 
bacteriennes ind€pendantes , exprimant chacun un gSne 
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nouveau different, en prenant comme critSre de selection la 

facultS d'exprimer la fonction (J -gal est parfaitement 

realisable. On peut ainsi rfialiser le criblage d r environ 

2000 colonies dans une boite de PStri ordinaire ayant 10 cm 

de diam&tre. Par consequent, on peut cribler environ 20 

2 

millions de colonies sur une feuille d'agar X-gal de 1 m . 

II est k remarquer que les colonies bactfiriennes apparais- 
sant en bleu sur les boites de P6tri X-gal pourraient Stre 
faussement positives en raison d'une mutation dans le 
gSnome bactSrien lui confSrant la capacity de mfitaboliser 
le lactose, ou pour d' autre raisons que celles qui r6sul- 
tent de I 1 activity catalytique de la protfiine nouvelle 
exprimfie par les cellules de la colonic. De tels faux 
positifs peuvent Stre directement Slimin€s en purifiant 
I'ADN des vecteurs d 1 expression provenant des colonies 
positives et en retransformant les cellules-h6tes E. Coli 
Z~,EBG~. Si 1'activitS (i-gal rSsulte de la nouvelle pro- 
tfiinje codfie par le nouveau gSne dans le vecteur depres- 
sion, toutes les cellules transformges par ce vecteur 
devraient presenter la fonction -gal. Au contraire, si la 
colonie bleue initiale rSsulte d'une mutation dans le 
g6nome de la cellule h6te, il s'agit d'un 6v6nement excep- 
tionnel indSpendant de la transformation et le nombre des 
cellules de la nouvelle souche transformfie E. Coli servant 
d f h6te susceptible d'exprimer la fonction ^> -gal devrait 
Stre petit ou nul. 

On insistera particuliSrement sur la puissance de la 
purification en masse simultanSe des vecteur s d 1 expression 
pour tous les clones positifs (bleus) suivie par la retrans- 
formation des bactfiries naives. Supposons que l'on dfisire 
effectuer un criblage en vue de sfilectionner des protSines 
ayant une fonction catalytique et que la probability qu'un 
nouveau peptide ou polypeptide remplisse cette fonction, au 
raoins faiblement, soit de 10~ 6 , alors que la probability 
que la souche microbienne h6te E. Coli est sujette 2t une 
mutation ayant pour effet qu'elle devienne capable de 
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remplir cette fonction, soit de 10~ 5 , on peut calculer que 
sur 20 millions de bactfiries transformSes soumises au 
criblage, 20 clones positifs seront, en moyenne, attribua- 
bles aux gSnes nouveaux sur les vecteurs d 1 expression que 
chacune comporte, alors que 200 clones positifs rfisulteront 
de mutations d'arri&re-plan. La purification en masse des 
vecteurs d' expression de 1 1 intfigralitS des 220 clones 
bactfiriens positifs et la retrans formation des bactSries 
nalves avec les vecteurs d" expression mis en commun pro- 
duira un grand nombre de clones positifs constituSs de 
toutes les bactfiries transferases avec les 20 vecteurs 
d 1 expression qui cedent les nouvelles protSines ayant la 
fonction d§sir£e, et un trSs petit nombre de clones bactS- 
riens rSsultant de mutations d'arriSre-plan contenant les 
200 vecteurs d* expression restant sans intSrSt. Un petit 
nombre de cycles de purification de vecteurs d 1 expression 
dans les colonies bactSriennes positives, ainsi que de 
retransformation, permet la detection des trSs rares 
vecteurs d 1 expression vSritablement positifs par rapport St 
une activitS catalytique d€sirSe, malgrS un bruit de fond 
trSs SlevS de mutations des cellules-hdtes pour cette 
fonction • 

A la suite d 1 operations de criblage de ce genre, on peut 
purifier la nouvelle protSine grace k la mise en oeuvre de 
techniques usuelles. La production de cette - protSine en 
grande quantitS est rendue possible grice au fait que 
1 1 identification de la protSine utile s'accompagne de 
1 • identification simultanSe du gSne codant cette protSine . 
Par consequent r on peut utiliser le vecteur d l expression 
lui-m&ne ou bien on peut transplanter le gSne nouveau dans 
un vecteur d 1 expression plus appropriS k la synthase et k 
Insolation en grande quantity. 

On peut appliquer des modes de criblage de ce genre k toute 
fonction enzymatique pour laquelle il existe un essai 
biologique appropriS. De tels criblages ne nScessitent pas 
que la fonction enzymatique que l'on recherche soit profi- 
table k la cellule hfite. On peut effectuer un criblage non 
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settlement par rapport a une fonction enzymatique ma is 
egalement pour toute autre propriSte" dfisiree pour laguelle 
on peut etablir un essai biologique approprie. On peut 
ainsi effectuer mime dans le cas simple de la fonction 
^-gal visualisee sur bolte de PStri a milieu X-gal, le 
criblage d'un nombre de genes nouveaux de l'ordre de 100 
millions ou m&me d'un milliard pour une activity cataly- 
tique ou une autre propriete d€sir6e. 

Selection des cellules-hates modifiees 



D' autre part, on peut utiliser des techniques de selection 
pour toute propriete, catalytique ou autre, dont la presen- 
ce ou 1' absence peut Stre rendue essentielle a la survie 
des cellules-h6tes contenant les vecteurs d' expression 
codant les genes nouveaux ou pouvant §tre utiles pour la 
selection de virus codant et exprimant le gene nouveau. A 
titre d'exemple concret, non limitatif , on va maintenant 
revenir sur la description du mode de selection. en relation 
avec la fonction -galactosidase. Une souche appropri£e 
Z~EBG~ d'E. Coli ne peut pas croltre en utilisant le 
lactose comme seule source de carbone. Ainsi, apr6s la mise 
en oeuvre de la premiere etape decrite ci-dessus, on peut 
cultiver un tres grand nombre d'hdtes transformes par des 
vecteurs d' expression codant les genes nouveaux, la culture 
etant effectuSe dans des conditions seiectives, soit en 
diminuant progressivement la concentration des autres 
sources de carbone, soit en utilisant seulement le lactose 
dSs le depart. Au cours d'une telle selection, la mutage- 
ndse in vivo par voie de recombinaison ou par recuperation 
explicite de vecteurs d' expression et mutagenese in vitro 
de leurs gSnes nouveaux par des mutagSnes varies, ou par 
tout autre technique usuelle, permet des ameliorations 
adaptatives de 1' aptitude a remplir la fonction catalytique 
desiree. Lorsqu'il existe a la foi des techniques de 
selection et des techniques commodes d'essai biologique, 
comme dans le cas du present exemple, on peut utiliser 
initialement des techniques de selection pour enrichir la 



WO 86/05803 ' 



PCT/CH85/00099 



26 



representation en bacteries hftte exprimant la fonction 
ft-gal, puis effectuer un criblage sur bolte de Petri a 
milieu X-gal afin d' identifier efficacement des cellules- 
positives. En 1' absence de technique d'essai biologique 
convenable, 1 • application de conditions de selection de 
plus en plus rigoureuses constitue la voie la plus facile 
pour - purifier un type ou un petit nombre de types de 
cellules-hdtes distinctes dont les vecteurs d' expression 
codent les protSines catalysant la reaction choisie. 

On peut utiliser ces techniques pour trouver de nouvelles 
prolines ayant une grande varied de caractferistiques 
structurelles ou fonctionnelles en plus de 1' aptitude a 
catalyser des reactions spficifiques. Par exemple, on peut 
effectuer un criblage ou une selection pour trouver de 
nouvelles prolines se fixant sur des sites cis-regulateurs 
de l'ADN et bloquant de ce fait l'expression d'une fonc- 
tion des cellules hfttes, ou encore bloquant la transcrip- 
tion de l'ADN, stimulant la transcription, etc. 

Par exemple, dans le cas de E. Coli une souche mutante du 
represseur de 1'opSron lactose U-) exprime de maniSre 
constitutive la fonction £-gal en raison du fait que 
1'opSrateur lactose n'est pas reprimg. Toutes les cellules 
de ce genre produisent des clones bleus sur les boites de 
P6tri contenant le miliev. X-gal. II est possible de/trans- 
former de telles souches hfttes avec des vecteurs d' expres- 
sion synthetisant des protSines nouvelles et effectuer un 
criblage sur boite de Petri a milieu X-gal en vue de 
detecter les clones qui ne sont pas bleus. Parmi ceux-ci, 
certains represented des cas ou la nouvelle proteine se 
fixe sur l'operateur lactose et reprime la synthase de 

£-gal. On peut purifier en masse de tels plasmides, les 
retransformer , isoler les clones qui ne produisent pas la 

£>-gal et effectuer ensuite une verification detailiee. 

Comme il est mentionne plus haut, le procede peut etre 
utilise aux fins de creer puis d' isoler non seulement des 
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prolines exploitables mais aussi des ARN et des ADN 
constituant des produits en soi, dotes de proprifites 
exploitables. Ceci rSsulte evidemment du fait que d'une 
part, le proc6de consiste a cr€er des sequences stochasti- 
ques d'ADN, susceptibles d'interagir directement avec 
d'autres constituants cellulaires ou biochimiques , et que 
d 1 autre part ces sequences donees dans un vecteur d' expres- 
sion- sont transcrites en ARN eux aussi capables de multi- 
ples interactions biochimiques. 

Exemple de mise en oeuvre du procede pour la creation et la 
selection d'un ADN exploitable en soi : 

Cet exemple illustre la selection d'un ADN exploitable et 
le purification et 1' etude du mecanisme diction des 
proteines regulatrices se liant a l'ADN. 

Soit une preparation du rficepteur de l'oestradiol, une 
protfiine obtenue par une mSthode connue en soi. En presence 
d'oestradiol, une hormone sterolde sexuelle, ce rScepteur 
change de conformation et se lie fortement a certaines 
sequences specif iques de l'ADN g€nomigue, affectant ainsi 
la transcriptidh de genes impliquSs dans la dif f€renciation 
sexuelle et le controle de la fertiliti. 

En incubant une melange constitue d'oestradiol, de son 
recepteur et d'un grand nombre de sequences stochastiques 
differant ins€rees dans leur vecteur puis en f iltrant le 
melange a travers une membrane de nitro cellulose on 
obtient une selection directe des sequences stochastiques 
se liant au complexe oestrogene - r€cepteur puisque seuls 
les ADN lies a une proteine sont retenus par la membrane. 
AprSs lavage et eiution, l'ADN liber6 de la membrane est 
utilise tel quel pour transformer des bacteries. AprSs 
culture des bacteries transf ormees , on purifie a nouveau 
les vecteurs qu'elles contiennent et on procede a un ou 
plusieurs cycles d' incubation, filtration et transformation 
comme decrit ci-dessus. Ces operations permettent d'isoler 
des sequences stochastiques d'ADN dotees d'une af finite 
e levSe pour le complexe oestradiol-recepteur. De telles 
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sequences sont susceptibles de noznbreuses applications 
diagnostiques et pharmacologiques, en particulier pour la 
mise au point d'oestrogSnes de synthase pour le contrOle de 
la feftilitS et le traiteroent de la st6rilitfi. 

Crfiation et selection d'un ARN exploitable en soi 

Soit un grand nombre de sequences d'ADN stochastique 
produites comme il a §t6 dgcrit et clonges dans un vecteur 
d • expression. II va de soi que 1'ARN transcrit & partir de 
ces s€quences dans des cellules-hfites transformfies peut 
§tre un produit exploitable en soi. 

A titre d'exemple non limitatif, on peut sSlectionner un 
gSne stochastique codant pour un ARN de trans fert (t-ARN) 
suppresseur par la procedure suivante : 

On transfonne par un grand nombre ( > 10 8 ) de sequences 
stochastiques , une souche bactfirienne competente comportant 
une mutation , "nonsense" dans le g&ne arg E. On Stale les 
bactSries trans formfies sur milieu minimal sans arginine et 
contenant l'antibiotique de selection du plasmide (ampicil- 
line s 1 il s 1 agit du vecteur pOC8 ) . Seules les bactSries 
transferases qui sont devenues capables de synthfitiser 
l f arginine pourront croitre. Ce phSnotype peut rSsulter 
soit d'une mutation en retour soit de 1 1 introduction dans 
la cellule d'un suppresseur. II est facile de tester chaque 
colonie transf ormSe pour determiner si le phSnotype arg + 
rSsulte ou non de la presence du gSne stochastique dans son 
vecteur : on se contente de preparer le plasmide de cette 
colonie et de verifier qu'il confSre le phfinotype Arg + & 
toute cellule arg E qu^l transfonne. 

selection de proteines capables de catalyser une sequence 
de rfiaction 

On va maintenant dScrire un autre mode de selection, qui 
est susceptible d 1 applications independantes , fondS sur le 
principe de la selection simultan€e # en parallSle, d'un 
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certain nornbre de nouvelles proteines capables de catalyser 
une sequence de reactions connect6es entre elles. 

L'id6e mere de cette m€thode est la suivante i €tant donnfi 
un ensemble de composes chimiques de depart considers 
comme des "briques" ou des elements de construction a 
partir desqueis on desire effectuer la synthese d'un ou de 
plusieurs composes chimiques d€sir€s par 1 • intermediate 
d'une sequence de reactions chimiques catalysees, il existe 
un tres grand nornbre de voies de reaction pouvant se 
substituer les unes aux autres completement ou en partie, 
qui sont toutes possibles du point de vue thermodynamique 
et qui conduisent de 1' ensemble des "briques" ou blocs de 
construction au compose chimique cible desire. Une synthese 
efficace d'un compose cible est favorisee si chaque etape 
d'au moins l'un des trajets reactionnels menant de l'ensem- 
ble des "blocs de construction" au compose cible est 
constitue de reactions qui sont chacune catalysees. Toute- 
fois, il est relativement moins important de determiner 
parmi les nombreux chemins reactionnels completement ou 
partiellement independants ceux qui b€neficient de la 
catalyse, Dans la description qui precede, on a montre 
comment il etait possible d'obtenir un tres grand nornbre de 
cellules h6tes qui expriment chacune une proteine nouvelle 
distincte. 

Chacune de ces proteines nouvelles est susceptible de 
catalyser l'une quelconque des reactions possibles dans 
1' ensemble de toutes les reactions possibles conduisant de 
V ensemble des blocs de construction au compose cible. Si 
un nornbre de proteines stochastiques suffisamment grand est 
present dans un melange reactionnel contenant les composes 
constituant les blocs de construction, de sorte qu'un 
nornbre suffisamment eieve des reactions possibles se trouve 
catalyse, il y a une forte probabilite qu'une sequence de 
reactions connectees entre elles pour conduire de V ensem- 
ble de blocs de construction au compose cible sera cataly- 
see par un sous-ensemble des nouvelles proteines. II est 
evident que le precede peut s'6tendre a la catalyse non 
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seulement d'un, mais de plusieurs composes cibles, simulta- 
n§ment. 

En se fondant sur le principe qui vient d'etre 6nonc6, on 
peut procfider de la maniSre suivante pour seiectionner en 
parallSle un ensemble de nouvelles proteines catalysant une 
sequence d£sir€e de reactions chimlques : 

1. Specifier I 1 ensemble desire de composes constituant les 
"blocs de construction" en utilisant de preference un 
nombre raisonnablement eieve d'esp&ces chimiques distinctes 
afin d'augmenter le nombre de voies potentielles concur- 
rentes menant au compose chimique cible desire* 

2. Dans un volume approprie d'une solution de milieu 
reactionnel, ajouter un nombre trSs grand de nouvelles 
proteines stochastiques isoiees k partir des cellules 
transform§es ou transfectSes synthfitisant ces protSines. 
Ef fectuer un essai pour determiner si le compose cible est 
forme. Si c'est le cas, confirmer que cetce formation 
necessite la presence du melange des proteines nouvelles, 
Si c'est le cas, ce melange doit contenir un sous-ensemble 
de proteines catalysant une ou plusieurs sequences de 
reaction menant de 1' ensemble de "blocs de construction" au 
compose cible. Purifier en divisant la reserve initiale de 
clones qui synthetisent 1* ensemble de nouvelles proteines. 
stochastiques, le sous-ensemble nficessaire pour catalyser 
la sequence de reactions conduisant au produit cible. 

Plus precisement , k titre d'exemple non limitatif, on va 
d€crire la selection d'un ensemble de nouvelles proteines 
aptes Si catalyser la synthase d'un petit peptide specif ie, 
& savoir un pentapeptide , k partir d'un ensemble de blocs 
de construction constitue de peptides plus petits et 
d'acides amines. Tout peptide est constitue par une sequen- 
ce lineaire de 20 types differents decides amines, orien- 
tee de son extremite amino k son extr€mit6 carboxe. Tout 
peptide peut §tre forme en une etape par condensation 
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terminale de deux peptides plus petits (ou de deux acides 
amines), ou par hydrolyse d'un peptide plus grand. Un 
peptide comprenant M residus pourra done etre forme d'un 
nombre egal a M -1 reactions de condensation. Le nombre de 
reactions, R, par lequel un ensemble de peptides ayant une 
longueur de 1, 2, 3... M residus, peut etre interconverti 
est plus grand que le nombre d'especes moleculaires T. Ceci 
s'exprime R/ T ^ M-2. Ainsi, en partant d'un ensemble donnS 
de peptides, un grand nombre de chemins rSactionnels 
indgpendants ou partiellement ind6pendants mene a la 
synthase d'un pentapeptide cible specif ique. On peut 
choisir un pentapeptide dont la presence peut etre commode- 
ment decelfie grace a un essai effectue par des techniques 
usuelles, par exemple par analyse HPLC (chromatographie en 
phase liquide sous haute pression) , chromatographie sur 
papier, etc. La formation de la liaison peptidique requiert 
de l'energie en milieu aqueux dilue mais, si les peptides 
participant aux reactions de condensation sont suf f isamment 
concentres, e'est la formation de .la liaison peptidique 
plutot que 1' hydrolyse qui se trouve thermodynamiquement 
favor isee et qui se produit avec un rendement eieve en 
presence d'un catalyseur enzymatique approprie, par exemple 
la pepsine ou la trypsine, sans necessiter la presence 
d'ATP ou d'autres composes a haute energie. On peut utili- 
ser un tel melange reactionnel de peptides de petite taille 
et dont les acides amines sont marques radioactivement , au 
moyen de traceurs radio^ctifs du type H, C, S, pour 
constituer 1' ensemble de blocs de construction a 
concentration suffisamment eievee pour conduire aux 
reactions de condensation. 

On peut, par exemple, proceder de la maniSre suivante : 
on dissout environ 15mg de chaque acide amine et petit 
peptide ayant 2 a 4 acides amines, choisis pour constituer 
1' ensemble de blocs de construction, dans un volume de 0,25 
ml a 1,0 ml de tampon phosphate a 0,1M, pH 7,6. On purifie 
un grand nombre de proteines nouvelles engendrees et 
isoiees comme decrit ci-dessus a partir de leur hftte 
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bactfirien ou autre. On dissout le melange de ces nouvelles 
protfiines jusqu^ une concentration totale finale de 
l'ordre de 0,8 k 1,0 mg/ml, dans le m&me tampon. On ajoute 
0,25 ml k 0,5 ml du ra§lange de prolines au mSlange de 
blocs de construction. On incube k une temperature de 25 °C 
k 40°C pendant 1 k 40 heures. On enlSve des parties aliquo- 
tes de 8 ul & intervalles rSguliers, dont le premier compte 
comme "tSmoin k blanc", avant l»adjonction du melange de 
nouvelles protSines. On soumet les fichantillons k une 
analyse par chromatographic en utilisant comme solvant un 
melange de n-butanol-acide ac6tique-pyridine-eau 
(30:6:20:24 en volume). On sSche le chromatogramme et on le 
r6vSle & la ninhydrine ou on 1 ' autoradiographic (avec ou 
sans Scran d 1 intensification) . Du fait que les composes 
constituant les § laments de construction sont marqu§s 
radioactivement, le compose cible sera radioactif et il 
aura une activitfi spficifique eievee permettant sa detection 
au niveau de 1 k 10 ng. Au lieu de 1' analyse par chromato- 
graphic habituelle, on peut effectuer une analyse par HPLC 
(high pressure liquid chromatography) qui est plus rapide 
et plus simple effectuer. De maniSre gSnirale, on peut 
utiliser les proc6d€s d' analyses usuels. De la sorte, on 
peut de teeter un rendement en composes cibles infSrieur & 
une partie par million en poids par rapport aux composes ou 
"materiaux de construction" initiaux. 

Dans le cas oil le pentapeptide est forme dans les condi- 
tions dScrites ci-dessus mais oil sa formation n'a pas lieu 
lorsqu'on utilise un extrait purifie comme ci dessus mais 
obtenu k partir de cellules transforxaSes par le vecteur 
d 1 expression dfipourvu d' insertion stochastique , la forma- 
tion du pentapeptide ne r§ suite pas de la presence des 
contaminants bact€riens et requiert done la presence d»un 
sous-ensemble de nouvelles prot&ines dans le melange 
r^actionnel. 
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L' 6 tape suivante consiste dans la separation du sous- 
ensemble particulier de cellules qui contiennent les 
vecteurs d 1 expression des nouvelles prolines catalysant la 
s€quence de reactions conduisant au pentapeptide cible. Par 
exemple si le nombre de reactions forraant cette sequences 
est 6gal k 5 , il y a environ 5 protfiines nouvelles qui 
catalysent les reactions necessaire. Dans le cas oil la 
"banque de clones" de bactfiries con tenant les vecteurs 
d 1 expression codant les gSnes nouveaux contient un nombre 
de g&nes nouveaux distincts de I'ordre de 1 000 000 , on 
effectue 1 9 isolation en masse de tous ces vecteurs d 1 ex- 
pression et la retrans formation de 100 ensembles distincts 

0 

de 10 bactfiries avec un rapport de vecteurs k bactfiries 
suffisamment faible pour que, en moyenne chaque ensemble de 
bactfiries soit transforms par seulement environ la moitifi 
du nombre de gSne initiaux, c ' es t-ct-dire environ 500 000. 
Par consequent, la probability pour qu'un quelconque de ces 
100 ensembles de bactfiries contienne I 1 ensemble des 5 
nouvelles protfiines critiques est figal k U/2) 5 =l/32. Parmi 
les 100 ensembles initiaux de bact6ries, environ 3 contien- 
dront les 5 transformants critiques. Dans chacun de ces 
ensembles, la quantity totale de g&nes nouveaux prfisente 
n'est plus que de 500 000 au lieu de un million. Par 
repetitions successives, dont le nombre total est dans le 
cas prSsent de 20, de cette procedure on peut isoler les 5 
nouveaux gSnes critiques. Aprds quoi, la mutagfindse et la 
selection de cet ensemble de 5 g&nes stochastique permet la 
recherche de fonctions catalytiques ameiiorfies. Dans le cas 
oil il est necessaire de catalyser une sequence de reactions 
comprenant un nombre de reactions de I'ordre de 20 et que 
20 g6nes codant des nouvelles protfiines doivent £tre isoies 
en parallSle, il suffit d'ajuster la multiplicity des 

Q 

transformations de sorte que chaque ensemble de 10 bactfi- 
ries recoivent 80% des 10 6 gSnes stochastiques en utilisdnt 
200 ensembles de ce genre. La probability que les 20 
nouvelles protfiines se trouvent dans un ensemble donnfi de 

20 

bacteries est de 0,8* c'est-^-dire environ 0,015. Par 
consequent, 2 parmi les 200 ensembles contiendront les 20 
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nouveaux g&nes necessaires pour catalyser la formation du 
compose cible. Le nombre de repetitions de cycles n€ces- 
saires pour l 1 isolation des 20 nouveaux g&nes est de 
l f ordre de 30. 

Les principes et les modes opfiratoires gnoncfis ci-dessus se 
g€n€ralisent du cas des peptides & de norobreux domaines de 
la chimie dans lesguels on peut ef f ectuer des reactions en 
milieu agueux dans des conditions de pH # temperature et 
concentration des solutions permettant les fonctions 
enzymatiques gen6rales. Dans chaque cas, il est necessaire 
de pouvoir disposer d'une methode d'essai pour deceler la 
formation du ou des composes cibles desires. II faut aussi 
choisir un nombre suffisamment eieve de "blocs de cons- 
truction" pour augmenter le nombre de sequences de reaction 
qui conduisent au compose cible. 

L 1 ensemble concret qui vient d'etre donne de la synthase 
d'un pentapeptide cible peut Stre generalise de la mani&re 
suivante : 

Le procede tel qu'il est decrit, engendre, entre autres 
produits, des peptides et proteines stochastiques. Ces 
peptides ou proteines peuvent agir, par voie catalytique ou 
autre, "sur d' autres composes. lis peuvent egalement consti- 
tuer les substrats sur lesquels ils agissent. On petft ainsi 
seiectionner (ou cribler) la capacite qu'ont les peptides 
ou proteines stochastiques d'interagir entre eux et de ce 
fait de modifier la conformation, la structure ou la 
fonction de certains d' entre eux. De m§me, on peut seiec- 
tionner (ou cribler) la capacite de ces peptides et pro- 
teines ci catalyser entre eux I'hydrolyse, la condensation, 
le transpeptidation ou d' autres reactions de modification. 
Par exemple, I'hydrolyse d'une proteine stochastique donn6e 
par un membre au moins de 1' ensemble des peptides et 
proteines stochastiques peut etre suivie et mesuree par 
marquage radioactif de la proteine donnee suivi d'une 
incubation avec le melange des proteines stochastiques, en 
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presence d'ions tels que Mg, Ca, Zn, Pe et des composes ATP 
et GTP. On mesure ensuite 1' apparition des fragments 
ra'dioactifs de la proline marquee, conune il a ete dficrit. 
La ou les proteines stochastiques qui catalysent cette 
reaction peuvent alors etre isoiees, ainsi que leur gene 
producteur, par diminution sequentielle de la librairie de 
clones transformants, comme decrit. 

Cne extension du procedfi consiste en la selection d'un 
ensemble de peptides et polypeptides stochastiques capables 
de catalyser une suite de reactions menant des constituant 
de dfipart (acides amines et petits peptides) a certains des 
peptides ou polypeptides de 1' ensemble. II est ainsi 
envisageable de sSlectionner un ensemble capable de cataly- 
ser sa propre synthase t un tel ensemble r€f lexivement 
autocatalytique peut s'etablir dans un chemostat oil les 
produits de reaction sont constamment diluSs mais ou la 
concentration, des produits de depart est maintenues cons- 
tante. On. peut verifier 1' existence d'un ensemble de cette 
nature par chromatographic sur gel a deux dimensions et par 
"HPLC" montrant la synthese d'une distribution stable de 
peptides et de polypeptides. Les volumes de reaction 
dependent du nombre d'especes molSculaires utilisees et des 
concentrations necessaires pour favoriser la formation de 
liaisons peptidiques par rapport a l'hydrolyse. La distri- 
bution des espSces moieculaires d'un ensemble autocataly- 
tique est susceptible de varier ou de deriver par suite de 
1' emergence d' ensembles autocatalytiques variants. Les 
peptides et polypeptides qui constituent un ensemble 
autocatalytique peuvent avoir certains elements en commun 
avec le vaste ensemble de depart (constitue des peptides et 
polypeptides codes selon le procede) mais peuvent aussi 
contenir des peptides et polypeptides non codes par 1' en- 
semble des genes stochastiques codant 1' ensemble de depart. 

L" ensemble des genes stochastiques dont les produits sont 
necessaire pour etablir un tel ensemble autocatalytique 
peut etre isoie comme il a ete decrit, par diminutions 
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sfiquentielles de la libraire de clones transformants. Par 
ailleurs, un ensemble autocatalytique peut contenir des 
peptides cod€s initialement par les gSnes stochastiques et 
formes de manidre continue dans 1* ensemble autocatalytique. 
Pour isoler ce sous-ensemble cod€ de peptides et de pro- 
lines on peut utiliser 1' ensemble autocatalytique pour 
obtenir, par immunisation chez l f animal, des sfirums poly- 
clonaux reconnaissant un trSs grand nombre des constituants 
de 1' ensemble autocatalytique. 

Ces sirums peuvent ensuite fitre utilises pour cribler la 
librairie de g&nes stochastiques pour y trouver les gSnes 
exprimant des protSines capables de se combiner aux anti- 
corps presents dans les sSrums. 

Get ensemble de g&nes stochastiques exprime un grand nombre 
des prot§ines stochastiques codSes qui persistent dans 
1' ensemble autocatalytique. Le reste des constituants codSs 
d'un tel ensemble autocatalytique peut Stre isolfi par 
diminution sSquentielle , comme dScrit, de la librairie de 
gSnes stochastiques dont le sous-ensemble d€tect§ par la 
mSthode immunologique a Stfi soustrait. 

Les ensembles autocatalytiques de peptides et de protSines 
obtenue de la maniSre qui vient d'etre dScrite sont suscep- 
tibles de trouver de nombreuses applications pratiques. 
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REVENDICATIONS 

1 . Procede de production de peptides ou polypeptides par 
voie microbiologique, caracterisS en ce que l*on produit 
simultan6ment, au sein d'un meme milieu, des genes au moins 
partielleinent composes de polynucleotides synthetiques 
stochastiques, que l'on introduit les genes ainsi obtenus 
dans des cellules-h6tes , que l'on cultive simultan€ment les 
souches independantes de cellules-hdtes modifi6es renfer- 
mant ces genes, de maniere a doner les genes stochastiques 
et a provoquer la production des prolines exprimfies par 
chacun de ces genes stochastiques, que l'on effectue le 
criblage et/ou la selection des souches de cellules-hdtes 
modifiers de facon a identifier les souches produisant des 
peptides ou polypeptides ayant au moins une propriete 
donnee, que l'on isole les souches ainsi identifies et 
qu'on les cultive de facon a produire au moins un peptide 
ou polypeptide ayant ladite propriety. 

2. ProcSdfi selon la revendication 1, caracterisfi par le 
fait qu'on produit les genes par copolymerisation stochas- 
tique des quatre sortes de deoxyphosphonucleotides A, C, G 
et T a partir des deux extremites d'un vecteur d' expression 
prealablement linearise, puis formation d'extremitSs 
cohesives de facon a former un premier brin d'ADN stocha- 
stique, constitue d'une molecule du vecteur d' expression 
possSdant deux sequences stochastiques dont les extremites 
3' sont complementaires, suivie de la synthase du second 
brin de cet ADN stochastique . 

3. Procede selon la revendication 1, caract§ris6 par le 
fait qu'on produit les genes par copolymerisation stochas- 
tique d' oligonucleotides bicatenaire sans extremites 
cohesives, de fag on a former des fragments d'ADN stochas- 
tiques, suivie de la ligation de ces fragments a un vecteur 
d' expression prealablement linearise. 

4. Procede selon la revendication 2 ou la revendication 3, 
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caracterisS par le fait que le vecteur d f expression est un 
plasmide* 

5. Proc£d£ selon la revendication 4, caractSrisS par le 
fait que le vecteur d* expression est le plasmide pUC8. 

6. ProcSdg selon la revendication 2 ou la revendication 3, 
caractfirisS par le fait que le vecteur d 1 expression est un 
fragment d'ADN viral* 

7. Proc6d6 selon la revendication 2 ou la revendication 3, 
caractSrisS par le fait que le vecteur d" expression est un 
hybride de plasmide et d'ADN viral. 

8. ProcSdS selon l*une des revendications 1 k 6, caracte- 
ris€ par le fait que les cellules-hdtes sont des cellules 
procaryotes . 

9. Proc£d€ selon I'une des revendications 1 & 7, caracte- 
risfi par le fait que les cellules-hdtes sont des cellules 
eucaryotes . 

10. ProcSde selon la revendication 8, caractSrisS par le 
fait que les cellules sont choisies parmi HB 101 et C 600. 

11. ProcSde selon la revendication 3, caractSrise' par le 
fait que les oligonucleotides f orment* un groupe d'octam&res 
palindromiques . 

12. Procede selon la revendication 11 , caractSrise par le 
fait que le groupe d'octam&res palindromiques est le groupe 
suivant : 

5 1 GGAATTCC 3 ' 
5' GGTCGACC 3' 
5" CAAGCTTG 3' 
5 f CCATATGG 3* 
5' CATCGATG 3' 
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13. Proc€d€ selon la revendication 3, caract€ris€ par le 
fait que les oligonucleotides forment un groupe d'heptamS- 
res palindromiques. 

14. Proc6d6 selon la revendication 13, caracterise par le 
fait que le groupe d'heptam&res palindromiques est le 
groupe suivant : 

5' XTC6CGA 3 9 
5' XCTGCAG 3' 
5 f RGGTACC 3* 
oil X = A r G, C ou T et R « A ou T. 

15. Proc£d€ selon la revendication 4 et 1'une des revendi- 
cations 12 ou 14, caracterise par le fait que l'on isole et 
purifie l f ADN trans formant des plasmides provenant d'une 
culture de souches ind€pendantes de cellules-hdtes modi- 
fiees obtenues en proc£dant de la manifere spScififie dans la 
revendication 11 ou la revendication 13, puis que l'on 
provoque la coupure de I'ADN purifie au moyen d'aumoins un 
enzyme de restriction correspondant k un site sp€cifique de 
coupure enzymatique present dans ces octamSres ou heptamS- 
res palindromiques ma is absent du vecteur d' expression 
utilisfi, cette coupure etant suivie de 1 1 inactivation de 
l 1 enzyme de restriction, et que l'on traite ensuite siraul- 
tan€ment 1' ensemble des fragments d 1 ADN stochastiques 
linearises ainsi obtenus par la T4 DNA ligase, de fag on k 
creer un nouvel ensemble d'ADN contenant des sequences 
stochastiques nouvelles, et que I 1 on utilise ce nouvel 
ensemble d'ADN trans formant pour modifier des cellules- 
h6tes et doner les g&nes, et, finalement, que l'on crible 
et/ou seiectionne et isole les nouvelles souches de cel- 
lules-hates transformees et qu'on les cultive de facon k 
produire au moins un peptide ou polypeptide. 

16. Procede selon la revendication 1, caracterise par le 
fait que ladite propriete est I 1 aptitude k catalyser une 
reaction chimique donn£e. 
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17. Procfidg selon la revendication 1 pour la production 
d'une plurality de peptides et/ou polypeptides, caractfirisS 
par le fait que ladite propri€t€ est V aptitude & catalyser 
une sequence de reactions conduisant d'un groupe initial 
donn€ de composes chimiques k au moins un compost edible* 

18. Procfide selon la revendication 16 pour la production 
d f un ensemble constitufi d'une plurality de peptides et/ou 
polypeptides r§f lexivement autocatalytiques , caract€ris€ 
par le fait que ladite propriety est I 1 aptitude de cataly- 
ser la synthase de cet ensemble lui-mSme k partir d'acides 
amines et/ou d 1 oligopeptides. 

19. ProcSdfi selon la revendication 1, caract€ris€ par le 
fait que ladite propriety est 11 aptitude k modifier s€lec- 
tivement les propriStfis chimiques et/ou biologiques d'un 
compost donn€. 

20. ProcfidS selon la revendication 19, caractSris§ par le 
fait que ladite preprints est 1' aptitude & modifier sfilec- 
tivement 1' activity catalytique d'un polypeptide. 

21. ProcSdS selon la revendication 19, caractSrisS par le 
fait que ladite propriety est 1' aptitude & simuler, ou 
modifier au moins une fonction biologique d f au moins un 
compose biologiquement actif . 

22. ProcSdS selon la revendication 21, caract6ris6 par le 
fait que ledit composS biologiquement actif est choisi 
parmi les hormones, les neurotransmetteurs , les facteurs 
d* adhfision ou de croissance et les rSgulateurs spficifiques 
de la replication et/ou de la transcription de l'ADN et/ou 
de la traduction de l'ARN. 

23. ProcSdS selon la revendication 1, caract§risg par le 
fait que ladite propriety est 1' aptitude Si se lier k un 
ligand donn€. 
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24. Utilisation du peptide ou polypeptide obtenu par le 
procede selon la revendication 23 pour la detection et/ou 
la titration d'un ligand. 

25 . Procede selon la revendication 1 , caract6ris6 par le 
fait que ladite propriete est d 1 avoir au moins un epitope 
semblable & l'un des epitopes d'un antigSne donnfi. 

26. Procede selon les revendications 19 et 25, caracterise 
par le fait que ladite propriete est l 1 aptitude & simuler 
ou modifier les effets d'une molecule biologiquement active 
et que I 9 on effectue le criblage et/ou la selection de la 
souche de cellules-hdtes modifiee produisant au moins un 
peptide ou polypeptide ayant cette propriete en preparant 
des anticorps contre cette molecule, et en utilisant ces 
anticorps, apr&s leur purification, pour identifier les 
souches contenant ce peptide ou polypeptide, puis en 
cultivant les souches ainsi identifies et en s6parant et 
en purifiant le peptide ou polypeptide produit par ces 
souches, et, finalement, en soumettant ce peptide ou 
polypeptide k un essai in vitro pour verifier qu'il pre- 
sente bien I 1 aptitude i simuler ou modifier les effets de 
ladite molecule. 

27. Polypeptides obtenus par le procede selon la revendica- 
tion 1 ou la revendication 26, utilisables comme substance 
active ayant une action pharmacologique et/ou chimio- 
therapeutique . 

28. Peptides ou polypeptides, obtenus par le procede selon 
la revendication 25, utilisables pour diminuer, in-vitro 

ou in- vivo , la concentration en anticorps libres, specif i- 
ques contre ledit antig&ne, par formation de liaisons entre 
ces peptides ou polypeptides et ces anticorps. 

29. Peptides ou polypeptides, selon la revendication 27 ou 
la revendication 28, utilisables comme agent suppresseur 
d* hyper sensibilite immunitaire. 
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30. Peptides ou polypeptides, obtenus par le procfid§ selon 
la revendication 25 , utilisables comme agent de creation 
d'une tolerance k l'Sgard dudit antigfcne. 

31 • Proc6d6 selon la revendication 25 , caract§ris6 par le 
fait que l'antigfene est I'EGF. 

32. Polypeptides obtepus par le proc^dS selon la revendi- 
cation 31 , utilisables pour le traitement chimioth§rapeu- 
tigue des epitheiiomes. 

33. Proc6d€ selon la revendication 1, caractSrisfi par le 
fait que I'on identifie et isole les souches de cellules- 
hdtes modifi§es produisant les peptides ou polypeptides 
ayant la propriety d€sir6e par chromatographie d'af finite 
sur anticorps correspondant k une proteine exprimfie par la 
partie naturelle de l'ADN hybride. 

34. Procfidg selon la revendication 33 , caractSrisfi par le 
fait que la partie naturelle de l'ADN hybride contient un 
g&ne expriroant lap>-galactosidase, et que I'on identifie et 
isole lesdites souches de cellules-h6tes modifiSes par 
chromatographie d'af finite sur anticorps anti-^i-galactosi- 
dase. 

35. ProcSdS selon la revendication 1 ou la revendication 
34 , caractSrisS par le fait q^aprBs expression et purifi- 
cation des peptides ou polypeptides hybrides, on sSpare et 
isole leurs parties nouvelles. 

36. Application du proc6d€ selon la revendication 25 ou la 
revendication 26 pour la preparation d'un vaccin, caracte- 
rise par le fait que l f on isole des anticorps contre un 
agent pathogSne et on les utilise pour identifier les 
clones produisant au moins une proteine ayant au moins un 
Spitope semblable k l'un des epitopes de 1' agent pathogSne, 
on cultive les souches de cellules-hfites modifiees corres- 
pondant & ces clones , de facon k produire cette proteine, 
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on isole et purif ie cette protSine k partir des cultures de 
ccs souches de cellules et on utilise cette protfiine pour 
la production d'un vaccin contre 1' agent pathogSne. 

37. Application selon la revendication 36 pour la prepa- 
ration d'un vaccin anti-HVB, caractfirisS par le fait que 
l'on extrait et l'on purif ie au moins une proline de 
capside de virus HVB, on injecte cette protSine dans 
l'organisme d'un animal capable de former des anticorps 
contre cette prot£ine, on recueille et on purif ie les 
anticorps ainsi form§s, on utilise ces anticorps pour 
identifier les clones produisant au moins une prot§ine 
ayant au moins un Epitope seroblable k l'un des Epitopes du 
virus HVB # on cultive les souches de cellules-hdtes modi- 
fies correspondant k ces clones, de fagon k produire cette 
protSine, on isole et purif ie cette protfiine k partir des 
cultures de ces souches de cellules, et on utilise cette 
protfiine pour la production d'un vaccin anti-HVB. 

38. Proc§d6 selon la revendication 1, caractfirisS par le 
fait que les cellules-hfites consistent en bactfiries du 
genre Escherichia coli dont le ggnome ne contient ni le 
gdne naturel exprimant la /S-galactosidase, ni le gSne EBG, 
c'est-i-dire des bactSries E. coli (Z~, EBG*) , que l'on 
cultive les cellules-h6tes modifies en presence du milieu 
X-gal et de l'inducteur IPTG, que l'on dStecte, dans le 
milieu de culture, les clones positifs pour la fonction 
/i-galactosidase et qu'on transplante ensuite cet ADN dans 
une souche de cellules-h&tes approprifie k la culture en 
grande quantitS en vue de la production industrielle d'au 
moins un peptide, polypeptide ou protSine. 

39. Proc§dS selon la revendication 1, caractirisi par le 
fait que ladite propriety est l 1 aptitude £ se lier k un 
compos€ donn€. 

40. Proc€d€ selon la revendication 39, caractSrisS par le 
fait que ledit composS est choisi parmi les peptides, les 



WO 86/05803 



PCT/CH8S/00099 



44 

polypeptides et les prolines. 

41. Proc6d€ selon la revendication 40, caracterisfi par le 
fait que lesdites prolines sont des protSines regulatrices 
de l'activiti de transcription ou de replication de l'ADN. 

42. Proc6d€ selon la revendication 39, caracterisfi par le 
fait que ledit compose" est choisi parmi les sequences d'ADN 
et d'ARN. 

43. Protfiines obtenues par le procfidfi selon la revendica- 
tion 40 ou la revendication 42. 

44. Procfidfi de production d'ADN, caractfirisfi par le fait 
que l'on produit simultanfiment, au sein d'un meme milieu, 
des genes au moins partiellement composes de polynucleoti- 
des synthfitiques stochastiques, que l'on introduit les 
genes ainsi obtenus dans des cellules-h6tes , de facon a 
produire. un ensemble de cellules-hotes modififies, que l'on 
cultive simultanfiment les souches indfipendantes de cel- 
lules-hotes modififies ainsi produites, que l'on effectue un 
criblage et/ou une selection de cet ensemble, de facon a 
identifier les cellules-h&tes qui renferment dans leur 
genomes des sequences stochastiques d'ADN prfisentant au 
moins une proprifitfi dfisirfie et que l'on isole l'ADN a 
partir de cultures de cellules-h&tes ainsi identifiers. 

45. Procfidfi selon la revendication 44, caracterisfi par le 
fait que ladite propriety est 1' aptitude a se lier a un 
compose" donnfi. 

46. Procfidfi selon la revendication 45, caractfirisfi par le 
fait que ledit compose" est choisi parmi les peptides, les 
polypeptides et les protfiines. 

47. Procfidfi selon la revendication 45, caractfirisfi par le 
fait que ledit compose" est un compose rfigulateur de 1' acti- 
vity de transcription ou de replication de l'ADN. 
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48. Procede selon la revendication 47, caracterise par le 
fait que ledit compos§ est une protfiine rggulatrice de 
I'activite de transcription ou de replication de I'ADN. 

49. Utilisation d'une sequence d'ADN obtenue par le procede 
selon la revendication 46 ou la revendication 47, comme 
sequence cis-r6gulatrice de la replication ou la transcrip- 
tion d'une sequence d'ADN voisine. 

50. Procede selon la revendication 42, caracterise par le 
fait que les protfiines obtenues prSsentent en outre la 
proprifitfi de modifier I'activite de transcription ou de 
replication ou la stabilitS de 1' ADN. 

51. Utilisation d'une proteine obtenue par le procede selon 
la revendication 48, pour modifier les propriStSs de 
transcription ou de replication ou de stabilite d'une 
sequence d'ADN, dans une cellule contenant cette sequence 
d'ADN, et exprimant cette proteine. 

52. Procede de production d'ARN, caracterise par le fait 
que I'on produit simultanement, au sein d'un mSme milieu, 
des gSnes au moins partiellement composes de polynucleoti- 
des synthetiques stochastiques, que l'on introduit les 
gSnes ainsi obtenus dans des cellules-h6tes, de fagon h 
produire un ensemble de cellules-h&tes modifiees, que l'on 
cultive simultanement les souches independantes de cellu- 
les-hdtes modifiees ainsi produites, que l'on effectue un 
criblage et/ou une selection de cet ensemble, de fagon & 
identifier les cellules-hdtes qui renferment des sequences 
stochastiques d ' AKN pr6sentant au moins une propri6te 
d€sir6e et que l'on isole l'AEN k partir de cultures 
de cellule-hdtes ainsi identifies. 

53. Procede selon la revendication 52, caracterise par le 
fait que ladite propri€te est 1' aptitude h se lier £ un 
compose donne. 
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54. Procede aelon la revendication 52, caracterisS par le 
fait que ladite propri€t6 est 1' aptitude a catalyser une 
reaction chimique donnfie. 

55. Proc6d€ selon la revendication 52, caracterisfi par le 
fait que ladite propri§t6 est d'etre un AEN de transfert. 
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« O a documant aa rtfarant a una divulgation oraJa, a un uaaga, a 
una axpoaltion ou toua autraa moyana 

« P » documant publl* avant la data da dtpot IntamatlonaJ. mala 
poatariauramant a la data da prlorita ravandiquaa 



'rt*rnatlonaJ ou * ta ** pnortta at n'appartanant paa 
a I *tat da la tachnlqua oartinant, mala cita pour comprandra 
la prmcipa ou la thaoria conatituant la baaa da I'invannon 
aX» documant particullaramant partinant: I'lnvantlen ravandi- 
quaa na paut atr* conafd*ra« comma nouvaila ou comma 
ImpUquant una aetlvit* invantiva 

«Y» documant partlculiaramant partinant; rtnvantion ravart- 
?I?. u ii "* p ??* ,* tr# ««5iWafit comma ImpUquant una 
actlvit* invantiva loraqua la documant aat aaaoclt a un ou 
pluaiwre autraa documanta da mama natura, catta combi- 
naiaon atam tvidanta pour una paraonna du mauar. 

« A » documant qui fait partia da ta matn>4amiaa da bravata 



IV. CIKTIFICATION 




Data a laqualla ta racharcrta Intamatlonala a at* atladivamani 
achavaa 

25 novembre 1985 



Administration cnargaa da la racharcha Intamatlonala 

OFFICE EUROPEEN DES BREVETS 



Oatad 



Signatura du fonctlonnalra autoria* 



Formulaira PCT/1SA/210 (dauiiama faullla) (Janvtar IStS) 



ANNEXE AU RAPPORT DE RECHERCHE INTERNATIONALE RELATIF 



A LA DEMANDE INTERNATIONALE NO. PCT/CH 85/00099 (SA 9773) 



La presente annexe indique les merabres de la famille de 
brevets relatifs aux documents brevets cites dans le rapport 
de recherche international vise ci-dessus. Lesdits membres 
sont ceux contenus au fichier informatique de l 1 Office 
europ6en des brevets a la date du 03/12/85 

Les renseignements fournis sont donnes a titre indicatif 
et n'engagent pas la responsabilite de l f Office europeen 
des brevets. 



Document brevet Date de Membre(s) de la Date de 

cite au rapport publication famille de brevets publication 

de recherche 



DE-A- 3246071 


14/06/84 


DE-A- 
DE-A- 


3300632 
3303173 


12/07/84 
02/08/84 


DE-A- 3303173 


02/08/84 


DE-A- 
DE-A- 


3246071 
3300632 


14/06/84 
12/07/84 


DE-A- 33006*32 


12/07/84 


DE-A- 
DE-A- 


3246071 
3303173 


14/06/84 
02/08/84 



Pour tout renseignement concernant cette annexe : 

voir Journal Officiel de l 1 Office europeen des brevets, No. 12/82 



